Health sensing for chronic disease management creates immense benefits for social welfare. Existing health sensing studies primarily focus on the prediction of physical chronic diseases. Depression, a widespread complication of chronic diseases, is however understudied. We draw on the medical literature to support depression prediction using motion sensor data. To connect human expertise in the decision-making, safeguard trust for this high-stake prediction, and ensure algorithm transparency, we develop an interpretable deep learning model: Temporal Prototype Network (TempPNet). TempPNet is built upon the emergent prototype learning models. To accommodate the temporal characteristic of sensor data and the progressive property of depression, TempPNet differs from existing prototype learning models in its capability of capturing the temporal progression of depression. Extensive empirical analyses using real-world motion sensor data show that TempPNet outperforms state-of-the-art benchmarks in depression prediction. Moreover, TempPNet interprets its predictions by visualizing the temporal progression of depression and its corresponding symptoms detected from sensor data. We further conduct a user study to demonstrate its superiority over the benchmarks in interpretability. This study offers an algorithmic solution for impactful social good - collaborative care of chronic diseases and depression in health sensing. Methodologically, it contributes to extant literature with a novel interpretable deep learning model for depression prediction from sensor data. Patients, doctors, and caregivers can deploy our model on mobile devices to monitor patients' depression risks in real-time. Our model's interpretability also allows human experts to participate in the decision-making by reviewing the interpretation of prediction outcomes and making informed interventions.
translated by 谷歌翻译
行业分配根据预定义的行业分类系统(ICS)将公司分配给行业,这对于大量关键业务实践至关重要,从公司的运营和战略决策到政府机构的经济分析。三种专家知识对于有效行业分配至关重要:基于定义的知识(即每个行业的专家定义),基于结构的知识(即ICS中指定的行业之间的结构关系)和基于任务的知识(即,域专家执行的事先公司行业任务)。现有的行业分配方法仅利用基于任务的知识来学习将未分配的公司分类为行业的模型,并忽略基于定义和基于结构的知识。此外,这些方法仅考虑已分配了公司的哪个行业,但忽略了基于分配的知识的时间特异性,即在任务发生时。为了解决现有方法的局限性,我们提出了一种新颖的基于深度学习的方法,该方法不仅无缝整合了三种类型的行业分配知识,而且还考虑了基于分配的知识的特定时间。从方法上讲,我们的方法具有两种创新:动态行业表示和分层分配。前者通过通过我们提出的时间和空间聚集机制整合了三种类型的知识,将行业代表为一系列特定时间的向量。后者将行业和公司的表现作为投入,计算将公司分配给不同行业的可能性,并将公司分配给具有最高概率的行业。
translated by 谷歌翻译
模块化设计是未来大型空间设施的On On On构造技术的基础。标准界面是未来空间机器人系统和空间设施模块化设计的关键技术。本文介绍了Petlock的设计和测试,标准和测试无性别界面可以在未来的模块化空间机器人操纵器和航天器之间传递机械载荷,功率和数据。Petlock采用完全无性别的设计,包括连接面,锁定机制,数据和功率接口。连接表面提供了较大的翻译和旋转错位耐受性,由于其120度对称和3D形状的设计。锁定机制具有三个锁定引脚撤回结构设计,这是简单可靠的。高锁定力,高容忍度,高可靠性和低成本的优势,Petloc K在未来的轨道施工任务中具有很大的应用潜力。
translated by 谷歌翻译
向前和向后触及逆运动学(FABRIK)是一种启发式逆运动求解器,逐渐应用于具有快速收敛和生成更真实配置的优势的操纵器。但是,在高误差限制下,Fabrik表现出不稳定的收敛行为,这对于操纵器的实时运动计划是不满意的。在本文中,提出了一种结合Fabrik和顺序二次编程(SQP)算法的新型逆运动学算法,其中Fabrik推迟的关节角度将被视为SQP算法的初始种子,以避免粘在局部最小值中。通过实验评估合并的算法,在高误差约束下,我们的算法比FabRik获得更高的成功率和更快的解决方案时间。此外,联合算法可以在路径跟踪中为UR5和KUKA LBR IIWA 14 R820操纵器生成连续轨迹,而无姿势误差和最终效应器的允许位置误差。
translated by 谷歌翻译
大多数加固学习算法优化了折扣标准,这些标准是有益的,可以加速收敛并降低估计的方差。虽然折扣标准适用于诸如财务相关问题的某些任务,但许多工程问题同样对待未来的奖励,并更喜欢长期的平均标准。在本文中,我们研究了长期平均标准的强化学习问题。首先,我们在折扣和平均标准中制定统一的信任区域理论,并在扰动分析(PA)理论中导出信托区域内的新颖性能。其次,我们提出了一种名为平均策略优化(APO)的实用算法,其提高了名为平均值约束的新颖技术的值估计。最后,实验在连续控制环境Mujoco中进行。在大多数任务中,APO比折扣PPO更好,这表明了我们方法的有效性。我们的工作提供了统一的信任地区方法,包括折扣和平均标准,这可能会补充折扣目标超出了钢筋学习的框架。
translated by 谷歌翻译
Depth map super-resolution (DSR) has been a fundamental task for 3D computer vision. While arbitrary scale DSR is a more realistic setting in this scenario, previous approaches predominantly suffer from the issue of inefficient real-numbered scale upsampling. To explicitly address this issue, we propose a novel continuous depth representation for DSR. The heart of this representation is our proposed Geometric Spatial Aggregator (GSA), which exploits a distance field modulated by arbitrarily upsampled target gridding, through which the geometric information is explicitly introduced into feature aggregation and target generation. Furthermore, bricking with GSA, we present a transformer-style backbone named GeoDSR, which possesses a principled way to construct the functional mapping between local coordinates and the high-resolution output results, empowering our model with the advantage of arbitrary shape transformation ready to help diverse zooming demand. Extensive experimental results on standard depth map benchmarks, e.g., NYU v2, have demonstrated that the proposed framework achieves significant restoration gain in arbitrary scale depth map super-resolution compared with the prior art. Our codes are available at https://github.com/nana01219/GeoDSR.
translated by 谷歌翻译
本文提出了一种基于中风的新型渲染方法(SBR)方法,该方法将图像转化为生动的油画。以前的SBR技术通常将油画问题作为像素近似。与这种技术路线不同,我们将油漆的创造视为一种自适应抽样问题。首先,我们根据输入图像的纹理复杂性计算概率密度图。然后,我们使用Voronoi算法将一组像素作为中风锚进行采样。接下来,我们在每个锚点上搜索并生成一个单独的石油冲程。最后,我们将所有笔触都放在画布上以获取油画。通过调整高参数的最大抽样概率,我们可以以线性方式控制油漆的细度。与现有的最先进的油画技术进行比较表明,我们的结果具有更高的保真度和更现实的纹理。用户意见测试表明,与其他方法的结果相比,人们对我们的油画的行为更加偏爱。更有趣的结果和代码在https://github.com/tzysjtu/im2oil中。
translated by 谷歌翻译
动态上下文化的单词嵌入代表单词的时间语义变化。我们提出了一种通过使用时间敏感的模板适应预定的掩盖语言模型(MLM)来学习动态上下文化词嵌入的方法。给定了两个快照$ C_1 $和$ C_2 $的一家公司,分别在两个不同的时间戳$ T_1 $和$ T_2 $上拍摄,我们首先提出了一种无监督的方法,以选择(a)与$ C_1 $和$ C_2 $相关的(a)枢轴术语,(b)与每个单独的快照中特定枢轴项相关的锚定项。然后,我们通过使用提取的枢轴和锚定项填充手动编译模板来生成提示。此外,我们提出了一种自动方法,以从$ C_1 $和$ C_2 $中学习时间敏感的模板,而无需任何人类监督。接下来,我们使用生成的提示通过在提示上进行微调来调整预处理的MLM至$ T_2 $。实验结果表明,我们提出的方法大大降低了从$ t_2 $中选择的测试句子的困惑,从而超过了当前最新的动态上下文嵌入方法。
translated by 谷歌翻译
现实世界中的数据通常显示出长尾巴的开放式(带有看不见的类)分布。实践识别系统必须在多数(头)和少数族裔(尾巴)阶级之间取得平衡,在整个分布中进行概括,并承认新颖的阶级(公开阶级)。我们将开放的长尾识别++(OLTR ++)定义为从这种自然分布的数据中学习,并优化了包括已知和开放类的平衡测试集的分类精度。 OLTR ++在一种集成算法中处理不平衡的分类,很少的学习,开放式识别和积极学习,而现有的分类方法通常仅着眼于一个或两个方面,并且在整个频谱中交付不佳。关键挑战是:1)如何在头和尾巴之间共享视觉知识,2)如何减少尾巴和开放式阶级之间的混淆,以及3)如何用学习知识积极地探索开放的课程。我们的算法OLTR ++将图像映射到特征空间,以便视觉概念可以通过记忆关联机制和学识渊博的指标(动态元元素)相互关联,这两者都尊重所封闭的见解类别的封闭世界分类并承认的新颖性打开课程。此外,我们提出了一个基于视觉记忆的主动学习方案,该方案学会以数据效率的方式识别未来扩展的开放类。在三个大规模开放的长尾数据集中,我们从Imagenet(以对象为中心),位置(以场景为中心)和MS1M(面部为中心)数据策划了三个标准基准(CIFAR-10-LT,CIFAR,CIFAR,CIFAR) -100-LT和Inaturalist-18),我们作为统一框架的方法始终展示竞争性能。值得注意的是,我们的方法还显示出积极探索开放阶级和对少数群体的公平分析的强大潜力。
translated by 谷歌翻译
我们提出蒙版频率建模(MFM),这是一种基于统一的基于频域的方法,用于自我监督的视觉模型预训练。在本文中,我们将视角转移到了频域中,而不是将蒙版令牌随机插入到空间域中的输入嵌入。具体而言,MFM首先掩盖了输入图像的一部分频率分量,然后预测频谱上的缺失频率。我们的关键见解是,由于沉重的空间冗余,预测频域中的屏蔽组件更理想地揭示了基础图像模式,而不是预测空间域中的掩盖斑块。我们的发现表明,通过对蒙版和预测策略的正确配置,高频组件中的结构信息和低频对应物中的低级统计信息都有用。 MFM首次证明,对于VIT和CNN,即使没有使用以下内容,简单的非叙事框架也可以学习有意义的表示形式:(i)额外的数据,(ii)额外的模型,(iii)蒙版令牌。与最近的蒙版图像建模方法相比,对成像网和几个鲁棒性基准的实验结果表明,MFM的竞争性能和高级鲁棒性。此外,我们还全面研究了从统一的频率角度来表示经典图像恢复任务对表示学习的有效性,并揭示了他们与MFM方法的有趣关系。项目页面:https://www.mmlab-ntu.com/project/mfm/index.html。
translated by 谷歌翻译